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Аннотация 

Предмет исследования. Предложен новый, практически эффективный метод обнаружения и оценивания 
координат центра изображения целевого объекта малого размера на зашумленной сцене. Метод является 
инвариантным к линейным конформным преобразованиям (поворот, сдвиг и масштаб). Метод. Рассмотрен 
бинарный классификатор, который принимает решение: содержит ли конкретный участок сцены искомое 
изображение или только фон? В основе предложенного подхода лежит интерактивная процедура поиска 
экстремума функции, которая аппроксимирует функцию правдоподобия бинарного классификатора. Для 
реализации поиска экстремума использована двухэтапная процедура на основании метода Нелдера-Мида. 
С целью обеспечения устойчивости к помехам и линейным конформным преобразованиям, при обучении 
классификатора применены как специальные методы обучения, так и подход, основанный на использовании 
ансамбля классификаторов, каждый из которых соответствует определенному масштабу. Основные 
результаты. Создан метод обнаружения размытого изображения объекта малого размера на сцене, зашумленной 
коррелированной помехой, с одновременным оцениванием координат центра искомого изображения. Метод 
устойчив к линейным конформным преобразованиям и успешно протестирован как на модельных, так и на 
реальных изображениях. Робастность метода к коррелированной помехе аддитивного типа, а также устойчивость 
к линейным конформным преобразованиям подтверждена результатами численного исследования. В рамках 
предложенного подхода, формально решена задача построения доверительного множества для координат 
центра искомого изображения, а также численно исследована эффективность полученного решения. Свойства 
доверительного множества оформлены в виде теоремы. Выполнено сравнение с классическим, корреляционно- 
экстремальным методом. При необходимости, предложенный метод легко обобщается на случай мультиклассовой 
постановки задачи. Практическая значимость. Метод может быть использован в системах машинного зрения, в 
том числе для оперативного анализа данных аэрофотосъемки, а также в системах видеоконтроля механического 
состояния сложного технического оборудования в условиях сильных метеорологических помех. 
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Введение 


В приложениях технического зрения, например, в 
задачах оперативного анализа данных аэрофотосъемки 
и видеоконтроле механического состояния сложно- 
го технического оборудования в условиях сильных 
метеорологических помех, возникает необходимость 
обнаружения на анализируемой сцене объекта малой 
формы, с сильно размытым контуром в условиях ин- 
тенсивной коррелированной помехи. Ввиду размытости 
контура изображения целевого объекта, а также из-за 
его сравнительно малой площади, методы детекции 
целевого объекта, основанные на использовании мел- 
ких геометрических особенностей изображения, ока- 
зываются практически неэффективными. В частности, 
для изображений упомянутого типа, такие известные 
методы как ТЕТ (Зсае-шуанаи{ Ееабиге Тгапзогил) [1 ], 
БОВЕ (Брее4де4 Ор КоБи$ Ееаиге$з) [2], ОКВ (Опещеа 
ЕАЗТ ап4 Кожеа ВВТЕР) [3], ЕАЗТ (Ра Аше Тетр]ае 
Мак) [4] практически неработоспособны. Все эти 
методы, в различной форме, используют в своей работе 
оценки локального градиента контраста, оценки гессиа- 
на контраста или подобные численные характеристики 
локальных областей изображения, которые в дальней- 
шем объединяются в так называемые дескрипторы 
(числовые наборы определенной мощности). Далее эти 
дескрипторы используются для описания множества 
ключевых точек изображения, описывая его конту- 
ра, углы и иные ключевые точки. Но для размытых, 
интенсивно зашумленных изображений качественно 
рассчитать оценки градиентов, гессианов и иных ха- 
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рактеристик изображений, основанных на локальных 
перепадах яркости, очень сложно, а в ряде случаев и 
просто невозможно. 

В этом состоит основная причина потери работо- 
способности упомянутой группы методов для размы- 
тых целевых изображений малого размера. Для об- 
наружения и одновременной классификации целевых 
изображений этого типа логично использовать методы, 
которые единомоментно исследуют изображения в не- 
которой, пространственно распределенной области, 
с размером, сравнимым с радиусом корреляции ис- 
комого изображения. В основе работы метода лежит 
концепция формирования геометрически целостного 
образа искомого изображения, причем этот образ еди- 
новременно собирается из группы пространственно 
разнесенных точек, в отличие от методов, основанных 
на исследовании локального контраста, которые снача- 
ла формируют множество разрозненных признаков и 
далее формируют из них образ, который сравнивается 
с эталоном. К методам такого типа, например, отно- 
сится классический, корреляционно-экстремальный 
метод [5—7], а также его современные обобщения [8, 9]. 
В настоящей работе предложен метод обнаружения и 
классификации, с одновременным оцениванием центра 
целевого, размытого изображения небольшого разме- 
ра на сцене, зашумленной коррелированной помехой. 
Метод основан на исследовании сцены в областях, 
размер которых сравним с радиусом корреляции ис- 
комого изображения и сохраняет работоспособность 
в условиях сильной размытости контуров при нали- 
чии интенсивного, коррелированного шума. Метод 
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Инвариантный к линейным конформным преобразованиям алгоритм обнаружения размытого изображения... 


устойчив к линейным конформным преобразованиям 
формы искомого объекта (поворот, сдвиг и масштаб) 
относительно шаблона. Проведено сравнение с клас- 
сическим, корреляционно-экстремальным методом, а в 
силу принципа, заложенного в основу предложенного 
метода, он легко распространяется на мультиклассовый 
случай. 


Идея метода 


В данном разделе приведено неформальное описа- 
ние предложенного подхода для тех читателей, которые 
не планируют погружение в формальную базу и после 
ознакомления с настоящим разделом могут продолжить 
чтение сразу с раздела «Результаты исследования ал- 
горитма». Основная идея предложенного метода осно- 
вана на введении бинарного классификатора, который 
принимает решение: содержит ли конкретный участок 
сцены искомое изображение или в данной точке сцены 
присутствует только фон? Важную роль играет функ- 
ция правдоподобия этого классификатора, которая тео- 
ретически достигает своего максимума именно в точке 
местоположения искомого объекта. Это обусловлено 
логикой обучения классификатора, которое произво- 
дится по специальной схеме. Для рассматриваемого 
случая задача бинарной классификации изображения 
конкретного участка сцены эквивалентна задаче об- 
наружения (детекции) искомого изображения на сце- 
не. В этом случае «сигнальный» класс представляет 
собой различные варианты представления искомого 
изображения, а «фоновый» класс включает в себя изо- 
бражения фона или фрагментов нецелевых изображе- 
ний. Важно то, что оценка координат точки максимума 
функции правдоподобия, де-факто, является оценкой 
центра искомого изображения. Таким образом, задачи 
обнаружения и оценивания координат центра искомого 
изображения инкапсулированы в процедуру бинарной 
классификации изображения конкретного участка сце- 
ны, которая, в виде побочного результата, формирует 
оценку координат центра изображения. В принципе, 
предлагаемый алгоритм подразумевает возможность 
обнаруживать одним и тем же классификатором сразу 
несколько типов целевых изображений, отличая их и 
от фона, и друг от друга. В этом случае речь идет о 
мультиклассовой постановке задачи, которая в данной 
статье не рассмотрена. Упрощая, можно считать, что 
предложенный метод является сильным обобщением 
методов совпадения изображений. 

Для аппроксимации функции правдоподобия клас- 
сификатора используются широко известные методы, 
например масштабирование Платта. Для интеграцион- 
ного поиска точки экстремума функции правдоподобия 
в области, сравнимой с радиусом корреляции искомого 
изображения, использован практически эффективный 
метод Нелдера-—Мида. С целью повышения вероятности 
поиска глобального экстремума поисковая процедура 
построена по двухэтапной схеме: 

— на первом этапе используется классификатор с бо- 
лее «широкой» функцией правдоподобия; 

—Й на втором этапе используется классификатор с «уз- 
кой» и более «точной» функцией правдоподобия, 
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где в качестве начальной точки используются ре- 

зультаты первого этапа. 

Вычислительные эксперименты показали, что пред- 
ложенный алгоритм робастен к аддитивному коррели- 
рованному шуму в следующем смысле: средняя ошибка 
оценивания центра искомого изображения при увели- 
чении интенсивности шума нарастает сравнительно 
плавно. Сделана попытка формализовать этот тип ро- 
бастности. Важная задача — обеспечение сохранения 
работоспособности алгоритма в условиях линейных 
конформных преобразований (сдвиг, поворот, масштаб), 
когда априорно неизвестно: под каким углом будет рас- 
положено целевое изображение на сцене и каков будет 
его масштаб? Решение этой задачи стало центральным 
моментом настоящей работы и достигнуто композици- 
ей двух подходов. 

Первый подход: для преодоления неопределенно- 
сти относительно значения масштаба использовался 
ансамбль классификаторов, каждый из которых был 
настроен методами машинного обучения на опреде- 
ленное значение масштаба, а результирующее решение 
представляло собой взвешенную сумму этих классифи- 
каторов. Значения масштаба, на которые настраиваются 
соответствующие классификаторы ансамбля — после- 
довательность чисел (масштабная сетка) с шагом и % 
(и больше нуля, конкретное значение этого параметра 
выбирается специальными методами), внутри интерва- 
ла, который определяет априорно допустимые вариации 
масштаба. Вычислительные эксперименты показали, 
что при шаге масштабной сетки равном 5 %, система 
гарантировала вероятность правильной классификации 
(детекции) не хуже, чем 0,99, при величине средней 
ошибки оценивания координат центра искомого изо- 
бражения, не превышающей величину 4 %. 

Второй подход: преодоление априорной неопреде- 
ленности относительно угла поворота искомого изо- 
бражения на сцене. В рамках подхода в обучающие 
множества, соответствующие каждому элементу мас- 
штабной сетки, внедрялись варианты образцов искомо- 
го изображения, углы поворота которых представляли 
собой последовательность значений углов поворота 
(ротационную сетку) с шагом 5 % внутри интервала 
(0,2). Этот достаточно простой подход также доказал 
свою практическую эффективность. 


Определения и обозначения 


Обозначим символом о — целевой объект. Любому 
объекту о соответствует счетное множество его возмож- 
ных изображений Е (0) = {{;}. Изображение конкретного, 
целевого объекта будем называть объектовым. 

В общем случае изображения могут не быть объек- 
товыми и содержать: 

— изображения только подстилающей поверхности 

(фона); 

— изображения фрагментов группы целевых или не- 
целевых объектов. 

Такие изображения будем называть фоновыми. 

Для множества Е@©) определено конечное подмно- 
жество 20) < Е©), состоящее из так называемых «ша- 
блонных» изображений объекта о. Все элементы РЁ) 
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априорно доступны для анализа и представляют собой 
изображения объекта о, полученные в разных условиях. 

Любое изображение Ёе Е ©), {= {ф(хух Е С с №"}, 
целевого объекта представляет собой совокупность 
наборов информативных, числовых параметров Ф(х), 
вычисленных в точках с координатами х Е СШ < А”. 
Параметры Ф(х) изображения # определены в совокуп- 
ности точек х, совместно образующих связную, замкну- 
тую область пространства СТ < А”. 

и5(х), х Е К" — значение набора информативных, 
числовых параметров в точкех Е А”, соответствующей 
местоположению фона или подстилающей поверх- 
ности. 

Область СГ] называется контуром объектового 
изображения {. Геометрический размер контура С|-] или 


его диаметр: |(|:]|| = о И хо||. Можно сказать, что 
х1,х2еС 


объектовое а. : определено только внутри 
соответствующего ему контура СТЁ.. 

Центр произвольной связной области 
(= {хх Е Ц} с К" — точка ху Е ( с декартовыми ко- 
ординатами: < хо>у = (Хшах — Хи )/2,1 <] < т, где 
а Мш<>7 ‚ Хшаку = Мах<>7 

хЕЦ хЕС 

Обозначим: Си И] — операцию определения цен- 
тра области И: ху = Си Ц]. 

Соответственно, центр изображения {= {ф(х)х Е 
е С[ {| — точка ху = Си С]. 

Когда центром изображения # е Е©) является точка 

= С№х)|, это записывается так: хо) = {Ф(ххо)х Е 
в Со]. 

Значение изображения ху) вточкех е С[Кху)]: Кхо)(х). 

[ФС хо), "© хо], ФО хо) Е (0,2) — полярные коорди- 
наты произвольной точки х Е С[Кхо)] при условии, что 
начало координат — точка хо Е А”. 

Для произвольной х е С[Кхо)] обозначим полярные 
координаты этой точки: 


{хр = ФОхо), (ху, = "о хо), 


где ф(х|хо) — угол; (хх) — радиус точки х Е С хо)] в 
полярной системе координат; Р — индекс, обозначаю- 
щий полярность координатной системы. 

=(>х) — прямоугольный параллелепипед (Воипате 
Вох) с размерами |=(>»)| = (х=, у=), для заданных 
О <х-, у= < о, с центром в точке х е А”, х = Сий[=(х)]. 
Так как т = 2, то в дальнейшем будем называть эти 
параллелепипеды рамками или поисковыми рамками. 
Если рамка Я(х) построена на изображении ©, запишем 
как: =(х|). Если место привязки рамки в конкретном 
контексте, или изображение, на котором размещена эта 
рамка, не имеют значения, то вместо =(х|0) запишем 
=) или = (|6). 

О = {о(х)х Е СО] с 2} — изображение, в общем 
случае представляющее из себя сцену, в том числе со- 
держащую и искомое изображение Ё (хо). Таким обра- 
зом, кроме искомого изображения (хо), сцена < может 
содержать изображения #,(х) = {ф;(х)|:} е Е©) иных, 
нецелевых объектов или фон {15(х)}. 

Границы контура СИ]: ВИ] = [$ 
е (0,2)}, где 7.(хо) = 
фЕ (0,27). 


Госхо)|ф 
Мах (х),. для произвольного 
хеСхо)] 
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(хо) = {ФОхо)х Е СИКху Е ЕФАР©) — искомое 
изображение объекта о, такое, что С[(хо)] < С[®]: 
СИЕ(хо)] © СО] = СКО). 

На сцене © задана декартова система координат 
(координатная плоскость), в которой производятся все 
координатные преобразования и расчеты. 

= — множество всех возможных поисковых рамок. 
Для простоты, но без потери общности, считаем, что 
стороны любой рамки = е Я параллельны осям коорди- 
натной плоскости сцены 62. В общем случае возможны 
варианты произвольной ориентации рамок по углу 
поворота. Данный случай будет рассмотрен в разделе 
«Исследование алгоритма на реальных изображениях». 

Координаты углов рамки =(х) составляют множе- 
ство пар АЕ] = {а ЕП < Е?. 

Когда говорится, что некое изображение < помеще- 
но в рамку =, это означает то, что Чо] ся , и записы- 
вается следующим образом: ={С[®]}. 

В общем случае рамка Я(х| ©) может служить для 
выделения некоторого фрагмента сцены © в окрестно- 
сти точки х. В этом случае рамка может не содержать 
полных контуров изображений Ё!Е Е“), напротив — 
включать в себя лишь фрагменты контуров изображе- 
ний Гили фона и5(:). Рамки такого типа для удобства 
условимся называть фоновыми, так как они служат для 
ограничения области фоновых изображений. 

А(6, Д, 5) — оператор линейного конформного пре- 
образования изображения, иначе называемый «апз]е- 
ргезегуше сопРогта| тар»: А? ерАВ.оЯ который 
преобразует изображение Ге Е ©) в /'е Е): Г’ = А(6, 
А, 5)/ с сохранением углов. Здесь параметры: 9 — угол 
поворота, А — сдвиги 5 — масштаб. 

Рамка называется «идеальной фиксирующей» для 
(хо) и обозначается Яр, если следующее высказывание 
верно: 


ЗЕ” в ВЕСИ) АСИ) < 
< Ен). 


Легко показать, что 


(хо = СИС] = 0% = СИЕ], 
УЕ ЕН ЕЕ: Я, =Яри У1Е Е: Э!Я +. Ее = 


Рамка называется «неидеальной фиксирующей» для 
(хо) и обозначается символом #_х, если & е =:(& # Яр Л 
л (Сий[СШ = Си я4С] = хо). На рис. 1 рамка с 
маркером 2 является «идеальной» для изображения ав- 
томобиля, а рамки с маркерами / и 3 — примеры «неи- 
деальных» рамок для целевого изображения. Маркером 
хо отмечен искомый центр изображения автомобиля. 
Для случая произвольной ориентации рамок «идеаль- 
ная» рамка будет иметь угол поворота, совпадающий с 
углом разворота изображения. Стоит обратить внима- 
ние на нечеткость, слабую контрастность и размытость 
контуров изображения. Но именно поиск и оценка цен- 
тра изображений такого качества является целью насто- 
ящей работы. 

Опорные о объекта о — изображения 
го ЕР), [= Г, = {1,..., Л, № < о, такие как Ею] = 
— С Ур), где размеры у Узр), 0 < ху» Ур < 0 опре- 
делены априорно. 
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Инвариантный к линейным конформным преобразованиям алгоритм обнаружения размытого изображения... 





Рис. Г. Примеры рамок 


Ею. 1. Ехатр[ез оГ Натез 


Масштаб 5: произвольного изображения Ге РР) — 
кортеж 5+ = (509, 50) = Их» УнИУзр); 0 < о 507 < со. 
УР = Р®)З6,, Др, 5: Е= А(0,, Др, 5 


где 9, Др, 5; — угол поворота, сдвиг и масштаб изобра- 
жения Ф относительно Ё., соответственно. 

Контур С], ограничивающий фрагмент фонового 
изображения ©, совпадает с его рамкой: С] = #(-|), 

= Сий[С]о]] = Си [2(|©)]. Для объектовых изобра- 
жений ГЕ Е«), в общем случае С[Ё = +. 

Таким образом, любая рамка может быть либо объ- 
ектовой, либо фоновой, в зависимости от того, контур 
какого изображения она ограничивает. 

Масштаб идеальной рамки =, — параметр 5 = 5+. 

Множество Я имеет следующее ограничение: 


УР е РОЗ ЕЯ: =Н:. 


Сцена © = {(х)х Ее СО]} наблюдается с аддитив- 
ным случайным шумом {6(х)}. Если для некоторого 
Е ЕО) и СЕ] < СФ], то Ух Е СШ]: ©(х) = Фх) + &(®). 

Зашумленный фрагмент сцены @©' = {ф(ахо) + &(х)х Е 
Е СО] П С) < ©, где Кж) = {ФО хо) Е Е ©), 
является =-гладким, если для некого = > 0 имеем: 


У (хе В хо)1, + ОЕ (ФОхо) + 600 — Фо + Ар) — 
— 6х +4) < Е? + =]. 


Здесь и далее Е — оператор математического ожи- 
дания. 

Определение. Оценка х' величины ху (центр изо- 
бражения #е Е©)) называется Е-робастной по отно- 
шению к шумовой составляющей &(х), если для любых 
двух ситуации, первая из которых (оценка х И соответ- 
ствует величине ЕЁ^(х), а вторая (оценка В ^) величине 
ЕЁ (х), ИВ: о ЕЁ (х), ЕЁ (х) < < К, имеет место 
следующая импликация: 


(ЕЕ? (ХЕ (о) > 1) > 
= (ЕВоЕВ (о > Е|х* хи" 0). (1) 
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Постановка задачи 


Дано: 
Множество Р©) = в (Е. Е” Е. = {ФО Е СЕ). 
2. Сцена ©, возможно содержащая целевое изображе- 
ние Ё(хо). 
Для неизвестных целевого изображения Ё!(хо) и 
параметров линейного конформного преобразова- 
ния 09, Ду, зу верна следующая запись: 


= 


3(0уе (0,27); Л», хе 2, [е Г.) (хо) = (0, Аь $0, 
Ухе СОС]: 0) = Фо) + 60°, 
Ухе СОС) <) = {Фи} & ©: (о (х) = 
= 5(%)) У (®(<) = фих) + 60), 


где 5(х) — аддитивный пространственно-коррели- 
рованный стохастический шум наблюдения с не- 
известным распределением, матрица корреляции 
ЕЁ2(х) < с которого неизвестна. 

3. В общем случае (ху) в Ро). 

4. Ухе СО]ПС ИО )]:0 6) = Фо) + 6). 
Необходимо: 

1) построить процедуру обнаружения зеагсй(@) 
целевого изображения Ё (хо) на сцене ©, а также 
точечную оценку х* его центра хо; К-робастную 
(К — некоторая конечная, положительная констан- 
та) к аддитивным, коррелированным шумам &(х) при 
условии априорной неопределенности относительно 
параметров линейного конформного преобразова- 
ния 09, Д,, 51: 


хе, у СИоТЙ © = СИ 


хеагсй(<>) = о ип я- 6 


2) для заданной величины 0 < а < 1 определить 
способ построения конечного множества У’, ||\'| < со, 
такого что 


Р(хо Е "(7 )) >1-а 


Метод решения 


Для обеспечения стабильности работы алгоритма в 
условиях коррелированных шумов, нечеткости целево- 
го изображения и неоднородностей сцены, а также для 
обеспечения устойчивости к влиянию линейных кон- 
формных преобразований (сдвиг, поворот и масштаб), 
решение поставленной задачи сводится к решению 
задачи классификации (возможно мультиклассовой) в 
экстремальной постановке, при условии специального 
способа формирования как обучающих множеств, так и 
самой поисковой процедуры. Как отмечалось в разделе 
«Идея метода», бинарная классификация изображения 
конкретного участка сцены эквивалентна задаче обна- 
ружения (детекции) искомого изображения на сцене, а 
процедура поиска координат точки максимума функции 
правдоподобия бинарного классификатора формирует 
оценку координат центра искомого изображения. 

Рассмотрим два множества. 

1. Множество ©/(0) (нулевой класс): 

00) = {0(0)(%)} составляют различные изображения 

Е, = Фо! е 2‘@®)\{ (хо) целевого объекта о, на фоне 
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и5(х), при наличии пространственных, коррелирован- 
ных шумов &(х), помещенные в соответствующие иде- 
альные рамки #:(х0 |) с центрами в точке хо. 


УСС) 90: Об = (69, 


фАхрхо) + 5(%), Их е С) 
из(х) - 6(х), Ихе ее ен) 
СтИЕАСШЕ] = хо. 


®«дх) = 


Если изображение ©(°)(хо) е ©) в качестве своего 
фрагмента содержит #. -(х0), будем говорить, что изобра- 
жение 00%) основано на #/(х0) и, для удобства сим- 
вольной записи, обозначать это следующим образом: 


©) = В[Ё0) |, 


где В — обозначение того, что изображение 0) (х%) 
основано на #;(х0). Изображение 09%) = 90) может 
быть основано только на одном изображении (хо). 

Координаты точек изображений 00 = ©(0) опре- 
делены в одной и той же координатной плоскости, 
которую назовем единой. 

0©(0) может быть разбито на «равномасштабные» 
подмножества: {И/0)}: (4,70) = ©), П м = ©), 
УВЕ о), Во] Е ©: (6 0.) У (51 = =5). 

2. Множество ©) (первый класс): 

@() = — составляют связные множества 
с; < С/х], Ё, = {Ф(х|хо)} Е Е©), на фоне и5(х), при 
наличии пространственных. коррелированных шумов 
&(х), помещенные в соответствующие «фоновые» рамки 
=(х;) различного размера (масштаба). 

Множество с; < ®, таково, что с; (81 < |СИхо) с, < 
< =2, О < 1, => < 00) \ (ху с). 


900 Е ОО), 0 = {©(х)})3= 6%): [Ух е #(х)): ®(х) = 
_ [© + &09, Ихес, | 
и5(х) + 5(%), Их Ее =(х.)\с; | 


По способу построения ©®@) состоит из участков 
изображений Ёе Е), помещенных в «фоновые» рамки, 
образующих множество С = {=(х;){)} таким образом, 
чтобы ни одна рамка из С не захватывала центр изо- 
бражения х\. 

Способ формирования множества фоновых рамок 
С — критически важен, поэтому рассмотрим его под- 
робнее. Рассмотрим окружность Сй(ж, г) с центром в 
точке хо Е А” и радиусом и, при и > 0, а также последова- 
тельность положительных величин: Ф = {Ф]1=1,..., И}, 


И 
>Ф:=2л, У [Ф;- 
=1 1<37<и—1 


полярные координаты некоторой точки [ф‚, 7| Е СИ(х, 7), 
Оф, г] — координаты этой точки в единой коорди- 
натной плоскости. Множество С рассмотрим в виде 
множества С“ ®) = {5% |ф; Е Ф}, представляющем со- 
бой множество рамок равного размера -.—- ш >|) 
такое, что 


ф;1|| = 2^/и. Пусть [ф»„, 7], ФЕ Ф — 


С: ©): Уф; е ФЯ!Е = =! е С“): (Зае АЕ! [ф, | е 
е Сп(х‹, г): а= О, !]). 
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Очевидно, что У? © С. е. 5 ПС, г) = 
Множество ©(0), подобно множеству ©(0), м 
на «равномасштабные» подмножества {ИО}, такие как 


(ОИ = 909, П.О = ©) и 


(Эн + 9р,) У (54, = 56, = 5). 


Множество Ио) Ц ИП назовем уровнем масшта- 
ба 5. 

Пусть [0] 0)] Е Х < АР — некая р-мерная функ- 
ция, вычисленная по изображению ©, помещенному в 
рамку =(х* |0). Будем называть эту функцию вектором 
характеристических параметров (вектором признаков) 
изображения в рамке =(х|). Как упоминалось ранее, 
рамка может быть либо фоновой, либо объектовой. По 
значению 9[=(х|0)] можно определять тип рамки, т. е. 
ответить на вопрос: ограничивает ли эта рамка целевой 
объект, либо она ограничивает фон? Собственно, эта 
простая идея и лежит в основе предлагаемого в данной 
работе подхода. 

Теперь рассмотрим можоствО бинарных клас- 
сификаторов {СЁ}: \5: СЁ; Х ЕВ: {0,1%}. аи 
СГ, настроен для работы с рамкой =: ЭР е Р©): Я: =ъ, 
которая является идеальной для некоторого Ёе Ё<5), 
и поэтому имеет масштаб 5 = 5;. В этом случае каж- 
дый СЁ, обучается на множествах {([Е(хо[мо,,)], 0) 
70; Е Ио} — нулевой класс и {([ЕСи 5), И 
= И} — первый класс, т. е. классификатор СГ. к 
учен на уровне масштаба 5. Иначе: СЕ ОЕС м] = = 
КЕ {0,1}, К — номер класса: это решение, о 
выносит классификатор СЁ.([Е(х|м?)]) по значению 


Ем]. 
УЭрсь(% е (0,1), хе Х: УХ[= 4) Е Х: ре ОГ:)]) = 
5 
= Р(СШхо)] < =). (2) 
Здесь для Х[Е(х|)] Е Х величина Р(С[хо)] < Я(х1)) 
представляет собой байесовскую вероятность того, 
что контур =(хФ, с центром в точке х, содержит контур 


изображения целевого объекта Фи центр контурах =хо. 
Причем: 


(х я хо) > (Р(СШхо)] < Ехо) > 
> Р(Схо)] < =). (3) 
Из импликации (3) сразу следует, что 


хи =Аге бир Р(С[хо)| < =). (4) 
хЕС[О*] 


Заменим в (4) величину Р(С[]хо)| < #1) на ее 
приближение Рек ЕС], например, на широко из- 
вестные масштабирование Платта или зойтах зсайпе 
[10], и рассмотрим оценку хо* в следующем виде: 


*=Аге Бир рег СИЕОЮ]. 
хЕСГО*] 


В дальнейшем для простоты вместо рег (Х[Е(%]) и 
СЕ (Е(хТ)]) условимся использовать более компакт- 
ные обозначения: ре (х) и СЁ(х) соответственно. 

С учетом (2) имеем хо* - ху. Таким образом, ху* — 
оценка искомой величины х‹, а величина рс/ (хо*) ха- 
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рактеризует качество этой оценки, так как исходя из 
выражения (2): 


Рег, хо") = РАС) < =). 


На основании способа обучения СЁ, не может быть 
эффективен для тех изображений Г, у которых 5+ # 5. 
Для того, чтобы преодолеть эту очевидную особенность 
в условиях произвольного масштаба классифициру- 
емых изображений, используется не один классифи- 
катор, а комбинация разномасштабных классифи- 
каторов, представляющая собой взвешенную сумму 
следующего вида: 


СР) = >, СЕ )УФсь, ©), (5) 


5ЕХ 


где > у(рсг.(%)) = 1, УС) > 0, УС) — строго монотонная, 
5Е5 
возрастающая функция; 5 — дискретное множество 


допустимых масштабов. 
В этом случае для оценки Р(С[хо)] < (хо) ис- 
пользуется не рсх (х), а величина 


р.б) = Уре Фу (ск, ©), 


5ЕЗ 
где 
хо = Аг бир р,(х). 
хеС[О*] 
Классификационное решение при использовании 
(5) принимается по правилу: [СЁ.|, т. е. по правилу 
округления к ближайшему целому. В качестве функции 


у(:) можно использовать У(Рег. 09) =р се рсы 69". 


Выбор множества 5, которое определяет априорно 
просчитанные варианты значений масштаба, описан в 
разделе «Стабилизация алгоритма...». 

Рассмотрим функционал: 


А(х|т) = 1- р) + *СЁх), т > 0. (6) 
Очевидно, что А(х[) = ШЕА(хт) при условии 
Хх 


СГ (х©)) = 0. При корректном обучении классификатора 
СЁ, равенство СТ, (©) = 0 будет достигаться с высокой 
вероятностью. В выражении (6) слагаемое тСЁ(х) вы- 
полняет роль штрафной функции. Штрафуются те зна- 
чения переменной х, при которых классификатор ука- 
зывает на принадлежность изображения внутри рамки 
= к классу 0) (фон или фрагменты нецелевых изобра- 
жений). Величина т выполняет роль регуляризирующей 
константы и подбирается в процессе настройки. 
Окончательно точечной оценкой величины хо будем 
считать величину 
хо =А!ге ШЕЕ А(х|). (7) 
хЕС[О*] 
Очевидно, что 


(ГЕ ЕО, хе Со]: р, = Е(р,(°) + 66), 


где С(х) — случайный компонент; ЕС(х) = 0. 

Для заданного 0 < а < 1 рассмотрим двусторонний 
квантиль —Со, Си, Р(-с < (©) < с.) > 1—а, (Р(6(х)| < с) > 
> | - @), который вычисляется на стадии предвари- 
тельного численного анализа, также как и величины 
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Е(р.(хо)) = 6 > Ои с... Значение с, зависит от свойств 

изображения, от способа вычисления величины )[Я(»|`), 

а также от статистических характеристик шумов &(х). 
Теорема. Рассмотрим множество: 


У= р 6 <, 


Пусть Е(р5(хо)) = Мах(Е(р5(<))) = 5. 


Хх 
Тогда Р(хуЕ Г) > 1- ча. 
Доказательство. Из условия теоремы имеем: 


(х = хо) => (Е(р5@°)) = 6). (8) 
Обозначим: 55 = с, — ((х). Очевидно, что 
Ухе\: (16(%)| < си) > (=> 0). (9) 
Далее: 
УхеХ: (1600) < си) > (р%х) — 6) = 
= Е (р) 6+ 60) < с.) > Еф) -6 <. (10) 


При (|6(х)| < са), х Е , из условия теоремы следует, 
что значения величины (Е(р5(х)) — 6) могут принимать 
любое значение из интервала Ёх = (0, &5), причем, с 
учетом (9), 0 е Еь, поэтому (10) можно записать в сле- 
дующем виде: 


УхеТ: (|| < с.) = (Е(р50))— 8) Е ЕД = 
> (Е (65) -5 =0 5. (11) 
Из (8) и (11) имеем: 
УхеХ: (| < с.) = (Е(р50))-8=0ЕЕ) > 
=> (ХЕ УТ). (12) 
Из (12) следует, что: 


(РСС < с) >1-а) > (ие) > 1-0). 


Теорема доказана. 

Предложенный метод формирования доверитель- 
ного множества во многом аналогичен методу, пред- 
ложенному в [11-13]. Результаты этой теоремы состо- 
ят не только в способе определения доверительного 
множества для величины хо, но и в способе принятия 
решения о том, является ли =(х|:) идеальной рамкой 
для целевого изображения? Иначе говоря: насколько 
вероятно то, что =(х|') содержит большую часть контура 
С (хо)] целевого изображения Ё (хо)? Правило простое: 


(рз(®) < с. +8) = (Ро) $ #01.) > 1-9. 


Выбор вектора признаков 


Вектор признаков [=(х|)] Е Х с АР вычисляется по 
части изображения ©, которое попало внутрь рамки =. 
С одной стороны, величина р (размерность )) должна 
быть минимизирована с целью снижения требований 
к мощности вычислителя. С другой стороны, слиш- 
ком малое значение р понизит надежность обнаруже- 
ния целевого изображения. Как правило, изображение 
имеет ключевые точки, которые в значительной мере 
характеризуют его индивидуальность, а следовательно, 
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и распознаваемость. Потому для конкретного изобра- 
жения желательно выделять эти точки и формировать 
вектор / в их окрестностях. Например, это могут быть 
границы контура, углы или иные значимые особенно- 
сти. Для выделения ключевых точек традиционно ис- 
пользуются такие методы как 51ЕТ, ЕАЗТ, ОВВ, ЗОКЕ. 
Однако многочисленные эксперименты показали, что 
все эти подходы теряют работоспособность в условиях 
интенсивных коррелированных помех и размытых кон- 
туров. В настоящей работе рассмотрены именно такие 
условия. В качестве альтернативы можно найти ин- 
формативные области изображения с использованием 
кластерного анализа либо метода главных компонент. 
Но эти методы довольно затратны в вычислительном 
аспекте, что вступает в противоречие с необходимо- 
стью обеспечения функционирования системы в реаль- 
ном масштабе времени. В рамках настоящей работы * 
представлен в следующем виде: 


ХЕ) = (5бф)[м |, ..., = ое)[х,]) е ЕР, 


Е е 5х): |х1 — х1| = 6, 

где0 > 0, Ее) = «бк р < хвуе; Е 9) = (==). 

С одной стороны, при малом р, вычисление у ука- 
занным образом предъявляет минимальные требования 
к мощности вычислителя, необходимой для его опреде- 
ления в реальном масштабе времени. Но с другой, — 
большие значения размерности х, приближающиеся 
к х=Уу=, обуславливают повышение вычислительной 
нагрузки при решении задачи (7). Исходя из этого, 
выбор параметра р (количество тестовых точек) пред- 
ставляет собой крайне важную задачу и осуществляется 
на этапе настройки системы на множество целевых 
изображений. В значительной степени на величины 
параметра р оказывает значение радиуса корреляции 
изображения, который определяет ширину автокорре- 
ляционной функции вблизи ее максимума и характе- 
ризует гладкость изображения. Следует заметить, что 
чем более гладким является изображение, тем меньше 
локальных экстремумов у функционала А(х|т), и тем 
проще решение задачи (7). Но, с другой стороны, глад- 
кие изображения — неинформативны, системе поиска 
целевого изображения не за что «зацепиться», что при- 
водит к снижению надежности поисковой процедуры. 
Результаты численного исследования влияния значения 
параметра р на эффективность работы поисковой систе- 
мы приведены в разделе «Исследование алгоритма на 
реальных изображениях». 


Классификатор 


В качестве алгоритма классификации использован 
классический ЗУМ (Зиррой Уесог МасЬше) [14], кото- 
рый в сравнении с альтернативами (Отаепе Воо5йпе 
[15, 16], ХОВооз+ [17]), обеспечил высокую продук- 
тивность и надежность. Также для решения задачи 
классификации может быть использована и конволюци- 
онная нейронная сеть, но для ее обучения потребуется 
большая мощность обучающих корпусов, поэтому этот 
вариант реализации классификатора в настоящей рабо- 
те не рассмотрен. 
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Стабилизация алгоритма: неформальное описание 
способов обеспечения устойчивости к линейным 
конформным преобразованиям 


Сцена, на которой предстоит найти объект Ё, мо- 
жет быть зашумлена пространственно-коррелирован- 
ной помехой, но, и это значительно усложняет задачу, 
объект может присутствовать на сцене в неизвестном 
масштабе и с неизвестным углом поворота. Формально 
основные методы обеспечения устойчивости метода к 
неопределенности такого рода были описаны в разделе 
«Метод решения», а в этом разделе будут приведены 
некоторые неформальные пояснения их сути. 

Обеспечение устойчивости поиска к влиянию 
пространственно-коррелированной помехи. Поис- 
ковая процедура призвана минимизировать (оптималь- 
но до нуля) сдвиг между центром хо искомого изобра- 
жения (хо) на сцене © и центром поисковой рамки. 
Для обеспечения устойчивости поисковой процедуры 
совместно использовались два подхода. 

Первый подход касается самого способа формиро- 
вания обучающих множеств ©(0) и ©), используемых 
при обучении системы поиска. Искомый класс, пред- 
ставленный элементами из 0), составляют изображе- 
НИЯ 00) (хо) = 00), 0) (ж) = В[Е(хо)], геометрические 
центры которых помещены в центры рамок 2, (х(|их,;), 
Е Е Го). Из самого способа построения этого множе- 
ства следует, что максимальная степень правдоподобия 
Рек. ЕС) будет у тех х, которые располагаются 
достаточно близко к искомой величине хо. 

Второй подход касается фонового класса ФИ) и 
построен так, что за пределами области СИ(х%, г) все 
участки изображений #, Е Е) в смеси с шумами и фо- 
ном, попавшие в рамки #(х|и’| ‚), такие как |СЁ\(ху, г)П 
(хм, 5)| < 1, относятся к фоновому классу (первый 
класс). Такой способ построения обучающих множеств, 
при использовании поисковой процедуры оптимизаци- 
онного типа, позволяет довольно эффективно оценивать 
хо в условиях пространственно-коррелированной поме- 
хи, обеспечивая устойчивость поисковой процедуры. 
Рис. 2 иллюстрирует способ формирования множеств 
©(0) и ©(). Здесь белая рамка соответствует классу 
(0), черные рамки — классу ©). Черный пунктирный 
круг обозначает Сй(х‹, г), черная точка — местополо- 
жение центра изображения х Е А”, которое подлежит 
оцениванию. 





Рис. 2. Формирование обучающих множеств 


Ею. 2. Тгаплие $е5 Гогтайоп 


213 


Инвариантный к линейным конформным преобразованиям алгоритм обнаружения размытого изображения... 


Обеспечение устойчивости к масштабу. Обес- 
печение устойчивости к масштабу сводится к опреде- 
лению состава множества 5, которое назовем масштаб- 
ной сеткой. Априорно задается диапазон допустимого 
изменения масштаба 5 в виде замкнутого интервала 
$ = (блин бах)» 5 © ®. Внутри $ определяется конечное 
упорядоченное множество точек («сеть»): 


о 
У : [ в = И - Их Е} 
157<и—1 


где о; — параметр шага сетки 5. 

Если \У : (5.41 -5)) = 9х, то сеть называется ре- 

1<7<и—1 

гулярной. Численные эксперименты показали, что ве- 
личина исх не обязательно должна быть значительной. 
Например, для практически удовлетворительного функ- 
ционирования системы обнаружения, при |%| = 0,25 
(25 % уровень различия в масштабах), достаточно, 
чтобы их = 5, т.е. о; = 5%. В общем случае для по- 
лучения практически приемлемых результатов сеть 5 
не обязательно должна быть регулярной. Вопрос оп- 
тимального выбора с, представляет собой отдельное 
исследование, и в значительной степени определяется 
помеховой обстановкой (матрицей пространственной 
корреляции шума ЕЕ(х1)Е(х) и его распределением), 
а также корреляционными свойствами изображений. 

Обеспечение устойчивости к повороту. По ана- 
логии с обеспечением устойчивости к масштабу, для 
устойчивости к повороту вводится множество ©, кото- 
рое назовем ротационной сеткой. Множество © состоит 
из априорно определенных значений углов поворота 6, 
целевого изображения { вокруг точки хо. 


9= {01 =1,.... по}: и =0, 0, 
У : (9:1 — 0; = - 2пп 1), 
15#<и—1 


где ое — шаг сетки ©. 
Для Е ©), Г, и 5 допустима следующая запись: 


У(1ЕТ, 0 Е ©, 5 Е 5) 5! 5.9) (ж,) в Е): 5.0) (ж) = 
= А(0, 0, 5) (хо), 


где Г, — множество индексов опорных изображений, 
определенное в разделе «Определения и обозначения». 

Мощность ротационной сетки ис принята равной 
72, что соответствует шагу углового перебора ъв = 5°. 
Численные эксперименты показали, что ов = 5° оказал- 
ся достаточным для обеспечения робастности алгорит- 
ма к поворотам искомого изображения. 


Поисковая процедура 


Процедура поиска экстремума (7) является важ- 
ным пунктом при реализации предлагаемого подхода. 
Основные требования к поисковой процедуре: устой- 
чивость к шумам, минимизация числа вычислений 
целевого функционала А(х|т) в процессе поиска, а также 
высокая вероятность нахождения глобального экстре- 
мума. Начальная точка поиска на сцене 62, в которой 
предположительно может находиться целевое изобра- 
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жение (хо), определена методами грубого обнаруже- 
ния. Например, для этой цели может использоваться 
поточечный пороговый классификатор, который при- 
нимает решение о том, что на фрагменте присутствует 
фон в том случае, когда изменение яркости в данной 
точке изображения во времени меньше некоторого по- 
рогового значения. В противном случае принимается 
решение о том, что в данной части сцены может при- 
сутствовать целевой объект. При анализе динамических 
сцен могут быть использованы различные варианты 
методов вычитания. Описание этих алгоритмов не рас- 
смотрены в настоящей работы. Так как в общем случае 
функционал А(х|т) является многоэкстремальным, для 
обеспечения высокой вероятности схождения к гло- 
бальному экстремуму поисковая процедура является 
двухэтапной. 

Задача первого этапа: определение точки хС/0В из 
области притяжения глобального экстремума. 

Задача второго этапа: «быстрый» поиск точки гло- 
бального экстремума (точки хо), начиная от точки хСР. 

Для первого этапа функционал А(х|т) модифициру- 
ется таким образом, чтобы сделать область притяжения 
глобального экстремума более «широкой», пусть и с 
потерей точности. Для этой цели на этапе обучения 
в состав множества Ио) искусственно добавляют об- 
разцы и Е Ио), такие как Я + и )), где с; — слу- 
чайные ВоЛИЧИНЫ, Ес, = 0, Ес? < с.  РаДкостЬ функ- 
ционала А(х|т) достигается в. параметров 
5УМ-классификатора (ти у). 

Изображения на рис. 3, а, Ь соответствуют «широ- 
кой» процедуре поиска А (х|т), а на рис. 3, с, Я — «уз- 
кой» процедуре поиска А_(х т). 

Структура функционала Ах) для каждого эта- 
па основывалась на различных настройках 5УМ- 
классификатора СГ ((-). В частности, для А1(х|) исполь- 
зовалось сигмоидное ядро (гиперболический тангенс), а 
для А >(х|т) — классический ВВЕ (Кад1а] Ваз15 Кипсйоп). 

Гиперпараметры ЗУМ подбирались для каждого 
этапа индивидуально. В качестве алгоритма поиска 
применен эффективный метод Нелдера—Мида [18], 
который не использует производную от функционала 
Ах). На каждой итерации поиска процедура Нелдера-— 
Мида оценивает: насколько далеко центр х,‚' поисковой 
рамки =(х;’) отстоит от точки экстремума целевого 
функционала А;(х|т). Экстремум функционала соот- 
ветствует оценке величины х(, а К — номер итерации. 
Процесс поиска останавливается по определенному 
правилу, момент останова соответствует точке х*, кото- 
рая объявляется оценкой для хо. В процессе численных 
экспериментов среднее число поисковых итераций при 
определении величины х* составило величину равную 
12, а среднее число вычислений значения целевого 
функционала — в диапазоне 30—40 (зависит от значения 
параметра р). В численных экспериментах, в качестве 
показателя точности оценивания координат экстре- 
мальной точки функционала А;(х|‹), использовалась 
статистическая оценка величины 


Ех" — х], 


где х’ — полученная в результате поиска оценка целе- 
вого параметра. 
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Рис. 3. Вид функционала А(х|т) процедуры поиска для первого (а, Ь) и второго (с, 4) этапов 
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Для оценки Ех” — хд|| процедура поиска запуска- 
лась М раз, с различными начальными условиями и 
различными реализациями шумового искажения. При 
практической реализации алгоритма, согласно Теореме, 
останавливать процесс поиска можно в момент 
Г = АгёМи Пре (Е(хл )]) > с, + 6}. В этом случае: 

1 


х` =хн". Кроме этого способа, в процессе численного 
исследования использовались и иные критерии оста- 
нова. В процессе вычислительных экспериментов по- 
лагалось М =5. 


Результаты исследования алгоритма 


Качество функционирования предложенного ал- 
горитма исследовалось на размытых изображениях 
различного типа, соответствующих разным уровням 
помеховой обстановки. В том числе рассматривались 
как искусственные модели, так и реальные изобра- 
жения. 

Исследование на искусственных изображениях. 
Рассматривались две модели изображений: 
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1. «Острая» модель: радиус корреляции в центре 12, 
2(х, у) = АПСИ + В,)(1 + В,) [1 + 5х, у), где х, у— 
независимые переменные; 2 — ордината. 41 = 10, 
Ву = (50555,02). .В:= (50:8 0,2) Е 
с, с, — координаты центра искомого изображения, 
с. -Ч0. =: 

2. «Плоская» модель: радиус корреляции в центре 
равен 18. 2(х, у) = АЕ (х, у) + А>ЦЦх, у) + Е, у), где 
Е(х, у) — пространственно распределенный, коррели- 
рованный шум; Е(х, у) = зш(2х)зшт(»(х, у)"; Обь, у) = 
= $11 (Со + х)зш( С! + У)((С> + х)(С, + Ут; С, = 2,5; 
Со = 0: АТО: 

На рис. 4, а представлены изображения тестовой 
функции «плоская» модель, а на рис. 4, Б — «острая» 
модель. 

Функции отличаются значениями величин ради- 
усов корреляции. Верхние фрагменты обоих частей 
содержат по четыре изображения, соответствующие 
различным вариантам аддитивного шума, который 
представлял собой гауссово поле &(х, у) с ЕЕ(х, у) =0 
и значениями дисперсии Е&ё?(х, у) Е {0,1,2,4}, при про- 
странственной корреляции на уровне 0,3. 
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Рис. 4. Изображения тестовых функций с различными радиусами корреляции: «плоская» (а) и «острая» (5) модели 
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На рис. 5 представлены результаты сравнения 
точности классического корреляционного метода и 
предложенного метода на «плоской» (рис. 5, а) и на 
«острой» (рис. 5, Ь) моделях, в зависимости от раз- 
мера рамки (ОГТ — полуширина поисковой рамки, 
ПГТ = |=(.)|2-!) при различных дисперсиях шумов. 
Рис. 5, а, Б содержат по четыре изображения, соответ- 
ствующие величинам Е&?(х, у) Е {2,4,6,8}. Параметр 
точности на оси ординат: оценка величины АЁ(х", хо) = 
= 100Е | — хо хо '. Из экспериментального матери- 
ала следует, что с возрастанием величины Е&2(х, у) па- 
раметр АЁ(х’, ху) увеличивается, т. е. точность плавно 
ухудшается. Однако существенно большее значение 
имеет размер поисковой рамки. Для рассмотренных 
моделей оптимальный размер рамки совпадает с раз- 
мером «идеальной» рамки, при котором обеспечивается 
оптимальная точность. Для обеих моделей оптималь- 
ный размер рамки равен 24. Из данных эксперимента 
следует, что модель с меньшим радиусом корреляции 
(«острая») обеспечила 25—30 % преимущество по точ- 
ности. Важно, что классический корреляционный метод 
оценивания х( существенно проигрывает предложен- 
ному методу по точности. Например, при |=(:)| = 24 
проигрыш по точности составляет около 100 %. 

На рис. 6 представлена зависимость точности оце- 
нивания хо предложенным методом в виде зависимости 
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параметра АЁ(х”, ху) от полуширины поисковой рам- 
ки ОГТ, для случая «плоской» модели при различных 
величинах ЕЁ?(х, у) Е {1,2,4,6,81. Для оптимального 
размера рамки (|=(:)| = 24) параметр АЁ(х”, ху) — мини- 
мален, т. е. достигнута наилучшая точность. С другой 
стороны, что ожидаемо, увеличение параметра ЕЁ2(х, у) 
ухудшает точность оценивания, но достаточно плавно. 
Таким образом, алгоритм робастен к шумам. 

На рис. 7 представлена зависимость величи- 
ны АЁ(х”, хо) от степени зашумления изображения 
ЕЁ?(х,у)Е {1,..., 15}, для моделей разного радиуса кор- 
реляции («плоская»: серый график и «острая»: черный 
график). Радиусы корреляции в центре, соответственно, 
12 и 18. Здесь |=(-)| = 24. Изграфика следует, что модель с 
большим радиусом корреляции («плоская») проигрыва- 
ет по точности модели с меньшим радиусом корреляции 
(«острая»). Проигрыш примерно на уровне 25-30 %. 
При увеличении дисперсии шума точность ухудша- 
ется для обоих изображений, но деградация точности 
носит достаточно плавный характер, что свидетель- 
ствует о робастности алгоритма к аддитивному шуму. 

На рис. 8 представлена зависимость точности от 
ЕЁ? (х, у) Е {1,..., 15} для «широкой» модели с 95 % 
доверительными интервалами для величины АЁ(х*, хд). 
Здесь |5(-)| = 24. Доверительные интервалы изображены 
вертикальными отрезками. 
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Рис. 5. Сравнения точности оценивания классического и предложенного методов для «плоской» (а) и «острой» (5) моделей 
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Для исследования робастности алгоритма к воз- 
действию аддитивных шумов рассмотрена следующая 
функция: 

ФЕИ (Е, - хх — хо Е СЛЕ) 


У: > 0: ЕЁ? (х) = ЕЕ? (ох) + 1. 


Поведение Ф(т + 1), 1 > 0 наглядно демонстрирует 
темп ухудшения точности при увеличении дисперсии 
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Рис. 6. Точность оценивания ху в зависимости от размера 
рамки и дисперсии шумов 
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аддитивного шума. Согласно (1), для того чтобы алго- 
ритм был А-робастен к аддитивному шуму, достаточно, 
чтобы \/1> 0: [ЕЕ | (%) < К) => (Ф1+1)<1}]|. В экспери- 
менте использовалась «широкая» модель при |= (:)| = 24. 
Из рис. 9 следует, что Ф(1 + Т) < 1, при увеличении 
ЕЁ?(х) от 1 до 14, при этом Ф({ + 1) возрастает достаточ- 
но плавно. Иначе говоря, предлагаемый алгоритм для 
данного изображения оказался №-робастным для А = 14. 

На рис. 10 представлена зависимость величины 
П1ат(У)|х ||! относительного диаметра байесовского 
доверительного множества У для величины ху при раз- 
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Рис. 7. Зависимость математического ожидания 
относительной ошибки от величины дисперсии помехи для 
двух изображений с различными радиусами корреляции 
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Рис. 8. Зависимость величины математического ожидания 
относительной ошибки от величины дисперсии помехи 
(с 95 % доверительными интервалами) 
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Рис. 9. Робастность алгоритма к влиянию аддитивного 
шума 
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Рис. 10. Зависимость диаметра 95 % доверительного 
интервала для хо от дисперсии аддитивного шума 
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личных дисперсиях аддитивных помех. Здесь ОГТ = 11, 
Р(хо Е У) > 0,95, а численные исследования реализо- 
ваны для «широкой» модели. Из приведенной зависи- 
мости следует, что величина П\лат(У)|х( |! находится 
в практически приемлемых границах (не превышает 
10 %) при сравнительно небольших шумах. А начиная 
с некоторого значения ЕЁ2(х, у) (в конкретном примере, 
с величины дисперсии 5) резко возрастает. В этой связи 
имеет смысл использовать доверительное множество 
У для небольших дисперсий шумов. Практически, это 
вполне допустимое ограничение. 


Исследование алгоритма на реальных 
изображениях 


На рис. 11-14 приведены результаты работы алго- 
ритма на четырех реальных сценах: 

—щ оригинальные и зашумленные (размытые) сцены 
(рис. 11-14, а, 5). Поступающие на обработку, за- 
шумленные сцены соответствуют ЕЁ-(х, у) = 7, ко- 
эффициент пространственной корреляции шума 
0,3. Поиск искомого изображения происходит на 
искаженной помехами сцене; 

— автокорреляционные функции сцен по двум осям в 
точке хо для исходного и зашумленного изображе- 
ний (рис. 11-14, с, а); 

— результаты поиска целевой картинки на зашум- 
ленном изображении (рис. 11-14, е). По оси орди- 
нат отложена относительная ошибка оценивания 
АЕ(х”, хо), в процентах, а по оси абсцисс — величи- 
на Её?(х, у) Е {1,..., 10%. Приведены 95 % довери- 
тельные интервалы для АЁ(х*, хо). В целом резуль- 
таты работы алгоритма хорошие. 

Для сцены «трактор на фоне песчаного грунта» 
(рис. 11) при ЕЁР(х, у) < 5 имеем АЁ(х*, хо) < 2 %, обе- 
спечение вероятности правильной классификации типа 
объекта 100 %. 

Случай «автомобиль на фоне лиственного леса» 
(рис. 12) — самый сложный. Но и тут: для ЕЁ2(х, у) <2 
имеем АЁ(х*, хо) < 5 %. Вполне приемлемый практиче- 
ски результат. 

Случаи на рис. 13 и 14 — сравнительно просты для 
предложенного алгоритма, и он справляется с ними 
довольно уверенно. 

Для сцен, изображенных на рис. 11-14, и соответ- 
ствующих им типов искомых изображений, множества 
00) и ОЙ) для этапа настройки (обучения) системы 
формировались по одной и той же схеме. 

Шаг 1. Множество ©(0) Ц ©0)(|©(0) 0 @И)}]| = 500) 
составляют зашумленные образцы сцен, и определено 
его разбиение на уровни Й/®) Ц И!) масштаба $5, в со- 
ответствии с масштабной сеткой 57) = {511 = 1,..., И}, 
п, =5, шагу, =5 %. 

Шаг 2. Каждый уровень масштаба 5 е 52) содержит 
такие изображения 0 (хо) = ВА, (хо), что 


1.9. (хо) (1 1, 0 Е 0), кЕМЗ): 
[вод (ско)(х) = 8.6.5 убо) + ВО, 
где 16.0, (х0)(х) = (6, 0, ) Сре) 08 (хо) = 
= совой Е М хе (| 0 о ео ив, = О ко, 
м3: = 1, .. ‚п. 
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Рис. 11. Изображение «трактор на фоне песчаного грунта»: оригинальная (а) и зашумленная (размытая) (Б) сцены; 
автокорреляционные функции (с, 4) и результаты поиска целевой сцены на зашумленном изображении (е) 


Е1е. 1. Те птасе ‘Чгасог оп запду огоци4”: ототаа1 (а) ап4 по1зу (Ыигед) (Ь) зсепез; алюсогге]аноп Рапсйоп$ (с, а) ап4 Фе 
гези оЁ зеагсшие Гог Фе {агое зсепе оп е по1зу ппаее (е) 


Ротационная сетка ©(^) такова, что ива. = 72, а шаг 
углового перебора ®в = 5°. 

На этапе обучения системы, для оценивания обоб- 
щающей способности, использовалась стандартная 
схема скользящего контроля, иначе называемая СУ 
(Сго5$ Уа|Чайоп), в варианте ГОО (]еауе-опе-ои®. Для 
обеспечения этапа тестирования множество ©(0)( | ©2(1) 
не используется. Напротив, формируются множества 


следующего типа: 


О = {009 (хо ДЮ 9 Ко) = В.) 
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где 
91.9.) 51 е 1, 0 Е ©, с 5, кЕМЗ, 


гео) бе) = 56. (оусо) + 89. 
об 0 49 - = 46) © м. 6,5 ХЕ С [02% Нь 
та, = 1609 Ко), МВ, = Ц, .. 


Принципиально важно то, что рт 5 1 (), 
© + 90), а 5) + 50. Неформально: помехи — раз- 
личны, ротационные сетки — различны, масштабные 
сетки — различны. |©(П| = 500. 


т 
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Рис. 12. Изображение «автомобиль на фоне лиственного леса»: оригинальная (а) и зашумленная (размытая) (5) сцены; 
автокорреляционные функции (с, 4) и результаты поиска целевой сцены на зашумленном изображении (е) 


Ете. 12. ТБе ппасе “саг оп Фе БасКогоипа оЁа 4ес14иои$ Ююгезе”: ометпа] (а) ап по1зу (Ыитед) (Б) зсепез; ажосотте]айоп 
ГопсНоп$ (с, 4) ап Фе геза оЁ зеагсшипо Гог Фе {агоей 5зсепе оп е по1зу ппазе (е) 


Все изображения, которые исследовались в процес- 
се численных экспериментов, были =-гладкими, для 
= = 0,5. Методы З@ЕТ, ЗОКЕ ОВВ и ЕА$ЗТ оказались 
совершенно неработоспособны для изображения рас- 
сматриваемого типа. 

Важный вопрос представляет собой выбор параме- 
тра р (число тестовых точек внутри поисковой рамки 
=). Этот вопрос исследован на реальных изображениях 
нескольких типов. На рис. 15 приведены результаты 
этого исследования для случая, когда целевой класс 
представлял собой смесь из изображений двух типов 
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(классов). Первый тип: «автомобиль на фоне асфаль- 
тового дорожного покрытия» и второй тип: «микроав- 
тобус на фоне асфальтового покрытия». Использование 
«смесевого» класса, в качестве целевого, было сделано 
с целью демонстрации способности алгоритма устой- 
чиво обнаруживать объекты, принадлежащие высоко 
вариабельному по составу классу, надежно отличая 
их от фона и достоверно оценивая их центр. Пример 
фрагмента корпуса, который использовался для обу- 
чения, приведен на рис. 15, а-7. Данная совокупность 
изображений приведена исключительно с целью де- 
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Рис. 13. Изображение «автомобиль на фоне асфальтового дорожного покрытия»: оригинальная (а) и зашумленная (размытая) 
(5) сцены; автокорреляционные функции (с, а) и результаты поиска целевой сцены на зашумленном изображении (е) 


Ето. 13. ТБе ппасе “саг оп фе БасКогоипа оЁ Ве азрвай гоа4 зигЁасе”: омеота] (а) ап по1зу (БЦитеа) (Б) зсепез; ащосогге]айоп 
РопсНоп$ (с, 4) ап Фе геза оЁ зеагсЬлао Гог Фе 1агое зсепе оп е по1зу ппасе (е) 


монстрации чрезвычайного низкого качества визуаль- 
ного материала, который способен эффективно об- 
рабатывать предлагаемый алгоритм. Очевидно, что 
исходные изображения сильно размыты и зашумлены. 
Так как рассматривается «смесевой» класс, часть кар- 
тинок относится к изображению легкового автомобиля 
(рис. 15, а-с, г, И), а часть — к изображению микроав- 
тобуса (рис. 15, РУ, 1). На рис. 15, / представлен график 
зависимости показателя точности (параметр АЁ(х*, ху), 
с 95 % доверительными интервалами), оценивания па- 
раметра ху в зависимости от значения параметра р. На 
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графике доверительные интервалы представлены вер- 
тикальными черными отрезками. Из графика следует, 
что наилучшее оценивание достигается при значении 
р = 1936. Но этому случаю соответствуют и наиболь- 
шие вычислительные затраты. По мере уменьшения 
величины р, точность плавно ухудшается, но даже для 
случая р = 176 (меньше «оптимальной» почти в 11 раз), 
величина АЁ(х’, хо) < 3,3 %, что вполне приемлемо с 
практической точки зрения. 

Выполнено исследование влияния на устойчивость 
и точность решения поисковой задачи фактора рас- 
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Рис. 14. Изображение «автомобиль на фоне грунтового дорожного покрытия»: оригинальная (а) и зашумленная (размытая) 
(5) сцены; автокорреляционные функции (с, а) и результаты поиска целевой сцены на зашумленном изображении (е) 


Еле. 14. ТБе пласе “саг оп Фе БасКогоипа оЁ Фе ипрауе4 гоа4 зи асе”: опетпа]| (а) ап4 по1зу (Ыоигед) (5) зсепез; аюсотаноп 
ГопсНоп$ (с, а) ап Фе геза оЁ зеагсшипо Гог Фе {агоей зсепе оп е по1зу ппазе (е) 


согласованности масштабных сеток 5(7 и 5%. Этот 
случай критически важен, так как точное совпадение 
масштабов изображения, на котором система была об- 
учена, с масштабом 5(и”) текущего изображения, на 
практике реализуется с очень низкой вероятностью. 
Есть все основания считать, что 5(©и!7) & 54. 

На рис. 16 приведены результаты исследования вли- 
яния несовпадения масштабов для ситуации, когда 
искомый класс состоял из смеси изображений двух 
типов (автомобиль и микроавтобус). Для тестирования 
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принято: 5(0) + 5(6), причем: 5) = {0, 8, 16, 20, 251, а 
57) = {0,1,..., 45}, т. е. | 5 [`] 50 | = 5. Устойчивость 
поисковой системы характеризуется зависимостью 
показателя «вероятность правильного обнаружения 
объекта» (Рер) от значения параметра масштаба 5 
(рис. 16, а). Точность поисковой системы характе- 
ризуется параметром средней ошибки оценивания 
координат центра искомого изображения (параметр 
(АЕ(х`, хо)) в зависимости от значения параметра мас- 
штаба 5 (рис. 16, 5). Горизонтальная линия ограничива- 


Научно-технический вестник информационных технологий, механики и оптики, 2021, том 21, №2 
заетс апа Тесптса! Чоигпа! о? поптаНоп Тесппоюче$, Меспатс$ апа Орйс$з, 2021, мо1. 21, по2 


А.В. Тимофеев 





3,0 


АЕ(х’, хо), % 


1,0 


0 
1936 968 660 484 396 352 308 264 220 176 
Количество тестовых точек в рамке, р 


Рис. 15. Выбор количества тестовых точек внутри 
поисковой рамки (р): фрагмент корпуса, на котором 
производилось тестирование (а-1); величины АЁ(х", хо) 
с 95 % доверительными интервалами для различных 
значений параметра р (7) 

Вю. 15. з@месноп оЁ фе питбег о {е3{ рош 5 ут Фе 
зеагсв Нате (р): Насте о? Ше согриз оп \1сЬ {езЯпе \а5 
регогтеа (а-7); ауегасе еггог$ оЁ Ше а|еоги т, ИВ 95 % 
сопЯдепсе ищегуа[$, Гог Чегет уа[аез о рагатеег р (7) 


ет уровень 5 %, черные точки на рис. 16, Б обозначают 
элементы 5(2), черная точка на рис. 16, а — гранич- 
ное значение из 5(2) равное 25. Из рис. 16 следует, 
что система поиска сохраняла приемлемую точность 
АЕ(х', хо) < 4 % (рис. 16, Б) и устойчивость (рис. 16, а) 
вплоть до значения 5 = 29. Хотя «ближайшее» к этой 
точке значение масштаба из 5“) равнялось лишь 25. 
Причем зависимости на рис. 16 вполне согласованы 
между собой: на интервале (0, 25) система функци- 
онировала ожидаемо удовлетворительно Рер > 0,99, 
АЕ(х*, хо) < 4 %, а на интервале (26, 29) продолжала 
оставаться работоспособной, обеспечивая Рер > 0,99, 
АЕ(х”, хо) < 5 %. Быстрая деградация системы поиска 
началась примерно от значения 5 = 30, а уже при 5 = 35 
было получено Рер = 0,7, что неприемлемо практиче- 
ски. Таким образом, для обеспечения устойчивости 
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Рис. 16. Зависимости эффективности поиска от значения 
параметра масштаба 5: вероятности правильного 
обнаружения объекта (Рер) (а); величины АЁ(х*, хо) (Ь) 
Ето. 16. Оереп4епсе ОР зеагсВ еЁслепсу оп зсае пллзтакй: 
Дерепдепсе ое ргоБаБ цу оЁ соггес обес ащесйоп оп Фе 
уаше оЁ Фе зсае рагатеег 5 (а); Череп4епсе оЁАЁ(х', ху) оп 
{Бе уае оЁ Фе зсае рагатеег 5 (5) 


алгоритма к фактору рассогласования масштабов, на 
интервале (0, 25), оказалось достаточно иметь всего 
пять опорных точек, составляющих множество 5(^), в 
которых происходит машинное обучение системы. 

Вывод: обученная (настроенная) описанным об- 
разом система сохраняет работоспособность для 
масштабов 5(7\5(), обеспечивая АЁ(х*, хо) < 5 % при 
Рав 0.99. 


Заключение 


Метод, предложенный в настоящей работе в первую 
очередь предназначен для работы с изображениями 
низкого качества и малого размера, с плохо выраженны- 
ми контурами. Численные исследования подтвердили 
его практическую работоспособность, а также состоя- 
тельность основных теоретических предпосылок. Для 
реализации метода на мобильной платформе потребу- 
ется перевод алгоритмов под архитектуру последова- 
тельного выполнения команд и в среде параллельных 
вычислений СОПЛА. 
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